跳到主要内容

博客推荐

Debezium

debezium to oracle 11g 实时同步

Dinky

Dinky 扩展 Phoenix 连接器使用分享

Dinky 构建 Flink CDC 整库入仓入湖

Dinky 扩展 kudu 实践分享

Dinky 扩展 iceberg 的实践分享

Dinky 扩展 ChunJun 的实践分享

打造 Flink + StarRocks+ Dinky 的极速统一分析平台

Dinky FlinkCDC 整库入仓 StarRocks

Dinky实践系列之FlinkCDC整库实时入仓入湖

Dinky 实践系列之 Flink Catalog 元数据管理

Dinky 扩展 ClickHouse 的实践分享

Dinky 扩展 Flink Redis 的实践分享

尚硅谷Dinky视频教程

Doris

按行业分类

互联网

京东

Apache Doris 在京东广告平台的应用

Apache Doris在京东双十一大促中的实践

京东物流基于 Doris 的亿级数据自助探索应用

Apache Doris物化视图与索引在京东的典型应用

Apache Doris 在京东客服 OLAP 中的应用实践

京东搜索实时 OLAP 探索与实践

知乎基于 Apache Doris 的 DMP 平台架构建设实践

同程数科基于 Apache Doris 的数据仓库建设

货拉拉基于 Apache Doris 的 OLAP 体系演进

百度

《Apache Doris 在百度商业大规模微服务全链路监控的实践》

Doris在用户画像人群业务的应用

基于Doris构建的小程序私域流量增长

百度爱番番实时 CDP 建设实践

知乎

知乎用户画像与实时数据的架构与实践

小米

基于Apache Doris的小米增长分析平台实践

Apache Doris 在小米集团的运维实践

美团

美团外卖实时数仓建设实践

搜狐

搜狐智能媒体数据仓库体系建设实践

快手

Doris on ES在快手商业化的最佳实践

中仑网络

Apache Doris 在中仑网络的应用实践

一点资讯

Apache Doris在一点资讯自媒体平台的应用

教育

新东方

新东方在线教育实时数仓的落地实践

作业帮

Doris在作业帮实时数仓中的应用&实践

网易有道

基于Doris的有道精品课数据中台建设实践

金融

天冕科技

Apache Doris 在 WeLab实时大数据平台的应用实践

交通物流

韵达

Apache Doris 在韵达物流领域的应用实践

蜀海

Apache Doris在蜀海供应链的实践

零售快消

特步集团

特步集团基于 Apache Doris 的零售数据仓库项目实践

按场景分类

高并发查询

Apache Doris 在京东广告平台的应用

Apache Doris在京东双十一大促中的实践

OLAP多维分析

京东物流基于 Doris 的亿级数据自助探索应用

Apache Doris物化视图与索引在京东的典型应用

Apache Doris 在京东客服 OLAP 中的应用实践

京东搜索实时 OLAP 探索与实践

Apache Doris在一点资讯自媒体平台的应用

Doris on ES在快手商业化的最佳实践

日志监控

《Apache Doris 在百度商业大规模微服务全链路监控的实践》

用户行为分析及用户画像

Doris在用户画像人群业务的应用

基于Doris构建的小程序私域流量增长

百度爱番番实时 CDP 建设实践

知乎用户画像与实时数据的架构与实践

基于Apache Doris的小米增长分析平台实践

实时数仓

Apache Doris 在中仑网络的应用实践

美团外卖实时数仓建设实践

Doris在作业帮实时数仓中的应用&实践

新东方在线教育实时数仓的落地实践

基于Doris的有道精品课数据中台建设实践

Apache Doris 在韵达物流领域的应用实践

Apache Doris 在 WeLab实时大数据平台的应用实践

数据仓库

搜狐智能媒体数据仓库体系建设实践

Apache Doris在蜀海供应链的实践

特步集团基于 Apache Doris 的零售数据仓库项目实践

Flink实时告警系统开发

官宣 Apache Flink 1.15 发布公告

《三步玩转: 如何通过Flink OceanBase CDC连接器快速查询数据》 by Amber 宝宝 文章: https://mp.weixin.qq.com/s/-OhnksTqhjwr_LzriXEhmQ 日期: 2022年10月

《基于Apache Hudi的多库多表实时入湖最佳实践》 by 潘超 文章: https://mp.weixin.qq.com/s/1WkzdrAH4MB5XS1Dp6FivA 日期: 2022年8月

《Demo: 三行 SQL 实现单品实时累计排行榜》 by 雪尽 文章: https://github.com/ververica/flink-cdc-connectors/discussions/1378 日期: 2022年07月

《B站增量数据湖探索与实践》 by 实时团队 哔哩哔哩技术 文章: https://mp.weixin.qq.com/s/pjZAjgHF-HdZNjr7LfY9JA 日期: 2022年06月

《Apache Doris 整合 Iceberg+Flink CDC 构建实时湖仓一体的联邦查询分析架构》 by 张家锋 SelectDB 文章: https://mp.weixin.qq.com/s/VnqlJ763nGWyOe1FJ8gt2g 日期: 2022年06月

《StarRocks X Flink CDC,打造端到端实时链路》 by 王天宜(StarRocks 解决方案架构师) 周康(阿里云开源大数据OLAP团队) 文章: https://developer.aliyun.com/article/936809 日期: 2022年05月

《Flink CDC 2.2 正式发布,新增四种数据源,支持动态加表,提供增量快照框架》 by 雪尽 文章: https://mp.weixin.qq.com/s/oLezzfC6LFENwO--BJpelQ 日期: 2022年03月

《Flink CDC 如何简化实时数据入湖入仓》 by 雪尽&云邪 文章: https://mp.weixin.qq.com/s/rMWDbVfyWCU2HSKpDMRUZw 日期: 2021年01月

《Flink CDC 新一代数据集成框架》电子书 出品人: 云邪 文章: https://mp.weixin.qq.com/s/ffh89OLxFVzHHaHIF4mIOA 日期: 2021年01月

《Flink MongoDB CDC 在 XTransfer 的生产实践》 by 孙家宝@XTransfer 文章: https://mp.weixin.qq.com/s/3_zwBdMXaDgYqghShSiEyQ 日期: 2021年12月

《同步 MySQL 分库分表,构建 Iceberg 实时数据湖》 by 宇侠@阿里 文章: https://mp.weixin.qq.com/s/mECOb5vSspPEsm6LZ8aN-g 日期: 2021年12月

《Flink CDC 系列 - 实时抽取 Oracle 数据,排雷和调优实践》 by 丁杨@农业银行 文章: https://mp.weixin.qq.com/s/IQiK7enF5fX0ighRE_i2sg 日期: 2021年12月

《Flink CDC + Hudi + Hive + Presto构建实时数据湖最佳实践》 by 罗龙文 文章: https://mp.weixin.qq.com/s/evHkDPlw9UQ0PFxQnZpZ3g 日期: 2021年11月

《Flink MongoDB CDC 贡献者 XTransfer: 深度参与开源才能不被淘汰》 by XTransfer 文章: https://mp.weixin.qq.com/s/hY03ZPvi-Mmzy0b24uc4rg 日期: 2021年11月

《Flink CDC 系列 - 构建 MySQL 和 Postgres 上的 Streaming ETL》 by 宇侠 文章: https://mp.weixin.qq.com/s/9OCEN6_KgIeF1DdMtmVdqA 日期: 2021年11月

《Flink CDC 2.1 正式发布,稳定性大幅提升,新增 Oracle,MongoDB 支持》 by 雪尽 文章: https://mp.weixin.qq.com/s/ImCATHNpI_hmWDwh13EvhQ 日期: 2021年11月

《Flink CDC 实现 MySQL 数据实时入 Apache Doris》 by 张家锋 @ 海底捞 文章: https://mp.weixin.qq.com/s/-kWgCUrQjcg2ee3-Rd-Pog 日期: 2021年10月

《Apache Hudi 在 B 站构建实时数据湖的实践》 by 喻兆靖 文章: https://developer.aliyun.com/article/789774 日期: 2021年9月

《Apache Flink CDC 批流融合技术原理分析》 by 好未来 文章: https://mp.weixin.qq.com/s/2mpCdVkK1wZPe-gAPY_B8w 日期: 2021年10月

《37 手游基于 Flink CDC + Hudi 湖仓一体方案实践》 by 徐润柏@37手游 文章: https://mp.weixin.qq.com/s/xoucbJxzO2Zkq_b2_WDUbA 日期: 2021年9月

《使用 Flink CDC + Hudi 构建流式数据湖》 by 陈玉兆@阿里 文章: https://mp.weixin.qq.com/s/G-HYUSj8ObqbpNKKYQFj5g 日期: 2021年8月

《Flink CDC 2.0 正式发布,详解核心改进》 by 雪尽 @ 阿里 文章: https://mp.weixin.qq.com/s/iwY5975XXp7QOBeV0q4TfQ 视频: https://www.bilibili.com/video/BV1m64y147rU (2小时13分开始) 日期: 2021年7月

《Flink SQL CDC 实践以及一致性分析》 by 王健,文乔 @ 民生银行 文章: https://mp.weixin.qq.com/s/tE70jJO6pZTe6oB0fKcZkQ 日期: 2021年3月

《Flink SQL CDC 上线!我们总结了 13 条生产实践经验》 by 曾庆东 @ 金地物业 文章: https://mp.weixin.qq.com/s/Mfn-fFegb5wzI8BIHhNGvQ 日期: 2020年9月

《基于 Flink SQL CDC 的实时数据同步方案》 by 云邪 @ 阿里 文章: https://mp.weixin.qq.com/s/QNJlacBUlkMT7ksKKSNa5Q 视频: https://www.bilibili.com/video/BV1zt4y1D7kt 日期: 2020年8月

FlinkCDC聚合mysql及pg表压入es实验报告

Flume

flume的TaildirSource介绍及升级改造

重磅: Flume1-7结合kafka讲解

Flume使用大全之kafka source-kafka channel-hdfs

flume-trouble-shooting

flume 中ETL拦截器、日志类型区分拦截器的实现方法

Flume面试题

flume到底会丢数据吗? 其可靠性如何? ——轻松搞懂Flume事务机制

Flume面试题(一)

大数据面试题知识点分析(十一)之Flume面试真题及答案

Flume 自定义拦截器 多行读取日志+截断

定义flume拦截器-实现了多种功能

zabbix部署监控集群,自定义监控Flume(图片多,步骤详细)

Greenplum

Greenplum Resource Group 资源组管理实用指南

Greenplum 是如何实现更新分片键的?

Hudi

基于Apache Hudi的多库多表实时入湖最佳实践

使用 Apache Hudi 实现 SCD-2(渐变维度)

Apache Hudi 0.12.0版本重磅发布!

Kubernetes

Kubernetes Handbook——Kubernetes 中文指南/云原生应用架构实战手册

从Docker到Kubernetes进阶

利用Vagrant创建k8s集群

使用kubeadm创建kubernets集群

我花了10个小时,写出了这篇K8S架构解析

K8s 从懵圈到熟练-集群伸缩原理

大数据平台Docker应用之路

Pulsar

TGIP-CN 直播合集

Kafka 已落伍,转角遇见 Pulsar!

最火的实时计算框架Flink和下一代分布式消息队列Pulsar的批流融合

Pulsar与Kafka消费模型对比

下一代分布式消息队列Apache Pulsar

Apache Pulsar 发布 2.5.1 版本

一起再看 BookKeeper(不知是不是大结局)

带你了解 Pulsar 里的跨机房复制

Apache BookKeeper 很复杂吗?你细品

Message Lifecycle:Pulsar 里的信息传递究竟是什么样子

互动连线|Topic 与 Broker 之间的秘密

SeaTunnel

百亿级数据同步,如何基于 SeaTunnel 的 ClickHouse 实现?

StreamPark

StreamX 1.2.3 正式发布,诸多更新重磅来袭